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摘要 : 天 文 用 户 从 数据 服务 得 到 最 佳 效 果 包 括 这 些 因素 ， 如 天 文 数据 存储 方法 与 数据 存 
储 的 便利 性 、 数 据 的 安全 性 ， 数 据 存 储 服务 维护 的 便利 性 ， 这 是 每 一 个 大 中 型 数据 相关 项 目 
对 数据 存储 及 共享 提出 的 要 求 。 分 析 了 领域 型 项 目的 存储 需求 ， 不 同 存储 服务 架构 的 差异 ， 
提出 采用 云 存 储 架 构 并 设计 了 领域 云 存储 服务 架构 ， 此 架构 不 仅 能 满足 从 数据 处 理 到 统一 存 
储 、 统 一 对 外 服务 的 需求 ， 对 用 户 数 据 查 询 服务 也 有 最 佳 体验 。 最 后 涉及 了 建立 灾 备 系统 ， 
及 其 规范 等 内 容 。 
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1 Ab E 

由 于 历史 天 文 观测 技术 的 限制 ， 观 测 资料 记录 在 胶片 、 照 相干 板 、 纸 质 等 易 损 介质 上 ， 随 着 时 间 
的 推移 ， 这 些 存储 介质 本 身 发 生变 化 ， 如 胶片 上 省 化 银 脱落 ， 致 使 图 像 失 去 原 有 的 完整 内 容 ， 无 法 使 
用 ; 纸 质 介质 则 会 变 黄 发 毒 ， 使 图 像 无 法 分 辨 ,致使 资料 无 法 使 用 。 我 国 太阳 物 理 观 测 最 早起 源 于 山 
东 青 岛 观测 站 ， 进 行 太阳 黑子 观测 并 手 描记 录 太 阳 黑 子 参数 ， 此 项 观测 至 今 已 有 90 年 的 历史 ， 达 7 
个 太阳 活动 周 。 国 内 开展 联合 黑子 观测 的 还 有 紫金 山 天 文 台 的 紫金 山 观测 站 、 云 南天 文 台 的 凤凰 山 观 
测 站 。 我 国 历史 太阳 观测 资料 还 有 太阳 横向 磁场 、 纵 向 磁场 、Halpha、 光 谱 、 射 电 、 日 食 等 ， 种 类 达 
30 种 之 多 。 历 史 观测 资料 的 提供 部 门 还 包括 位 于 北京 国家 天 文 台 的 怀柔 太阳 观测 基地 、 天 文 台 总 部 
的 太阳 活动 预报 部 门 及 南京 大 学 空间 科学 院 。 目 前 资料 前 期 处 理工 作 共 在 7 个 部 门 、 分 布 在 5 个 地 理 
位 置 开展 。 存 储量 从 几 TB 至 几 十 TB 不 等 ， 呈 现 出 资料 分 散 、 品 种 多 的 特点 。 

上 述 这 些 部 门 是 我 国 太阳 活动 监测 与 预报 的 主要 部 门 。 我 国 太阳 物 理 观测 资料 具有 地 域 优 势 ， 不 
仅 具 有 国际 先进 水 平 的 观测 设备 产 出 了 一 流 的 资料 ， 而 且 这 些 资料 在 国际 上 具有 稀缺 性 、 唯 一 性 、 互 
补 性 ， 是 不 可 再 生 的 珍贵 资源 ， 可 为 科学 研究 提供 系统 或 个 案 资 料 ， 包 括 弥补 资料 的 欠缺 ， 研 究 案例 
的 证 认 ， 并 可 服务 于 太阳 活动 预报 研究 。 因 此 我 国 太阳 物理 观测 资料 数字 化 、 标 准 化 工作 得 到 科技 部 
基础 性 工作 专项 资助 ， 从 而 使 这 些 珍贵 资料 得 到 保留 ， 并 最 终 为 中 国 及 世界 太阳 物理 研究 、 太 阳 活 动 
预报 服务 。 

在 资料 完成 数字 化 、 规 范 化 、 标 准 化 等 处 理 后 ， 系 统 最 终 要 在 中 国 太 阳 物 理 门 户 网 站 按照 一 定 规 
则 形成 可 供用 户 查 询 的 资料 ， 且 有 相应 的 处 理 软件 可 供 使 用 。 按 计划 前 期 各 类 资料 经 过 处 理 后 要 逐渐 
上 传 至 门户 网 站 的 服务 器 ， 后 续 ， 在 存储 系统 完成 后 ， 各 部 门 可 直接 在 这 个 系统 中 处 理 各 自 的 资料 ， 
资料 处 理 完 成 后 ， 由 系统 自动 将 其 继续 上 传 到 门户 网 站 的 服务 器 。 这 些 历 史 资料 可 与 当前 其 它 每 日 观 
测 资料 融合 在 一 起 ， 形 成 太阳 活动 周期 上 更 完整 的 我 国 太阳 物理 观测 资料 ， 供 用 户 查 询 使 用 。 由 于 资 
料 珍贵 ， 需 要 考虑 资料 的 备份 及 灾 备 ， 在 系统 设计 中 体现 了 数据 备份 与 灾 备 方案 。 

数据 提供 方 专长 自 方 数据 处 理 ， 简 单数 据 存盘 性 质 的 保存 也 容易 做 到 ， 但 一 方面 对 于 大 多 数 数 据 
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用 上 需 形 成 多 波段 、 多 种 类 数据 的 门户 网 站 ， 对 于 查询 分 析 更 有 价值 ， 对 于 用 户 查 找 资 料 更 便利 。 


2 存储 方法 与 规范 


2.1 云 存 储 简介 

云 存储 下 是 以 数据 存储 和 数据 管理 为 核心 的 云 计算 系统 ， 云 存储 是 在 云 计算 概念 基础 上 延展 而 
出 的 新 概念 ， 是 指 通 过 集群 应 用 、 网 格 技 术 或 分 布 式 文件 系统 等 功能 ， 将 网 络 中 多 种 不 同类 型 的 存储 
设备 通过 应 用 软件 集合 起 来 协同 工作 ， 共 同 对 外 提供 数据 存储 和 业务 访问 功能 的 系统 。 它 避免 了 传统 
存储 技术 需要 知道 存储 设备 具体 型 号 、 接 口 和 传输 协议 等 具体 存储 信息 才能 实现 存储 的 繁琐 问题 。 存 
储 架 构 由 存储 层 、 基 础 管理 层 、 应 用 接口 层 和 访问 层 组 成 。 存 储 层 是 云 存 储 系统 中 最 基础 也 是 最 重要 
的 部 分 。 存 储 设备 可 以 是 光纤 通道 ， 也 可 以 是 其 它 硬 件 。 在 本 系统 中 为 多 个 存储 阵列 的 组 合 。 一 套 存 
储 设备 管理 系统 对 这 些 存储 设备 进行 存储 集中 管理 ， 即 敢 辑 虚拟 化 管理 、 存 储 状态 监控 及 存储 维护 升 
级 等 的 管理 服务 。 基 础 管理 层 是 云 存储 实现 最 困难 的 部 分 ， 也 是 云 存储 最 核心 的 部 分 。 基 础 管理 层 具 
有 分 布 式 文件 系统 、 网 络 计算 以 及 集群 等 技术 ， 完 全 能 够 实现 异 构 存 储 设备 间 的 协同 工作 ， 使 得 整个 
云 存 储 系统 能 够 协调 工作 ， 为 用 户 提供 优质 、 统 一 的 服务 。 基 础 管理 层 还 具备 数据 内 容 的 分 发 、 数 据 
的 压缩 、 数 据 备份 等 其 他 服务 。 由 于 这 些 服务 是 用 户 直接 感受 到 的 ， 所 以 基础 管理 层 的 成 功 决定 着 云 
存储 系统 能 否 成 功 地 服务 于 用 户 。 应 用 接口 层 作 为 云 存储 和 应 用 交流 的 部 分 ， 是 最 灵活 的 部 分 。 开 发 
人 员 可 以 根据 不 同 的 用 户 需求 开发 不 同 的 程序 接口 ， 这 一 层 的 灵活 性 完全 体现 在 开发 不 同 的 程序 接口 
是 由 用 户 决定 的 ; 同时 ， 该 层 负责 网 络 接 人 、 用 户 认证 、 权 限 管理 等 功能 。 访 问 层 直接 面向 用 户 服 
务 ， 用 户 根据 不 同 的 需求 ， 可 以 访问 云 存 储 系统 ， 获 得 不 同 的 服务 ， 提 供 多 种 服务 类 型 和 访问 形式 服 
务 于 多 种 用 户 的 需求 。 
2.2 采用 云 存储 的 考虑 因素 

比较 之 前 的 存储 ， 更 看 重 云 存储 具有 的 如 下 特点 : (1) 使 用 的 便利 性 。 使 用 同一 套 存 储 系统 为 包 
括 服务 器 与 个 人 计算 机 在 内 的 各 种 终端 提供 存储 服务 。 具 体 而 言 ， 存 储 系统 采用 挂 载 方式 ， 在 挂 载 之 
后 ， 各 个 数据 提供 方 的 服务 器 或 PC 将 像 使 用 本 地 存储 那样 使 用 云 存 储 系统 的 空间 ; (2) 减少 数据 提 
© 供 方 的 开发 与 维护 成 本 。 各 个 数据 提供 方 不 必 考 虑 更 多 自身 存储 方面 的 构建 设计 ， 数 据 提供 方 将 更 多 
c 精力 放 在 善 长 的 数据 处 理 上 ; (3) 维护 的 便利 性 。 集 中 管理 ( 自动 收集 相关 内 容 、 统 一 内 容 结构 、 相 
r= 关 范 围 内 文件 搜索 、 快 速 发 现 知识 ) ; 对 于 数据 提供 方 提供 存储 与 计算 资源 使 用 、 调 配 、 自 动 计算 资 
= 源 ， 这 种 服务 在 安全 控制 方式 下 进行 (如 VLAN 、 防 火 墙 规则 、 负 载 均衡 等 ) ; 协同 工作 ( 自动 同步 共 
享 文件 、 网 盘 文 件 分 享 、 快 速 发 布 给 客户 、 严 格 完善 的 权限 控制 、 便 捷 安 全 ); (4) 数据 的 安全 性 。 
文件 备份 无 需 操作 ， 自 动 同步 备份 系统 数据 ， 云 存储 技术 ， 保 留 文 件 修改 历史 版 本 ， 随 时 恢复 误 修 
改 、 误 删除 文件 ; (5) 存 储 扩展 优势 。 由 于 采用 元 数据 与 数据 分 离 技术 ， 云 存储 系统 具有 几乎 无 限 扩 
展 的 特点 。 集 群 存储 方法 与 传统 存储 方法 的 不 同 在 于 不 是 一 个 已 经 被 划分 好 的 相互 独立 的 数据 空间 ， 
而 仅仅 是 一 个 目录 ,通过 聚合 各 个 存储 节点 的 存储 空间 实现 用 户 空间 的 可 扩展 性 ， 使 得 每 个 终端 挂 载 
的 空间 都 可 以 自 适应 地 伸缩 ， (6) 共享 性 。 因 为 各 个 终端 挂 载 的 仅仅 是 目录 ， 用 户 可 以 指定 将 目录 下 
某 一 文件 共享 给 某 一 个 或 几 个 用 户 ， 这 样 这 些 用 户 就 可 以 对 这 一 文件 进行 操作 ， 实 现 了 数据 文件 的 共 
享 性 ; (7) 文 件 检索 速度 优势 。 由 于 采用 元 数据 与 数据 分 离 技 术 ， 可 以 将 其 1/0 性 能 进行 聚合 ， 由 此 
带 来 的 带宽 提升 在 大 文件 读 取 上 的 优势 非常 明显 。 在 面 对 海 量 文件 时 ， 用 户 的 检索 速度 可 以 比 传统 架 
构 提高 数 倍 。 从 长 远 发 展 角 度 ， 构 建 云 存储 系统 无 论 从 数据 源 提供 方 使 用 的 便利 性 、 系 统 维护 的 便利 
性 、 数 据 安全 性 维护 方面 ， 还 是 存储 设备 利用 、 扩 展 、 数 据 应 用 发 展 及 数据 检索 速度 ， 都 是 当前 的 最 
佳 选 择 。 这 样 全 方位 的 发 展 趋势 将 使 未 来 产生 结构 更 简单 、 功 能 更 强大 、 价 格 更 低廉 的 云 存储 产品 。 

总 之 ， 云 存储 系统 面向 多 种 类 型 的 网 络 在 线 存储 服务 ， 数 据 的 安全 、 可 靠 、 效 率 ， 即 它 的 高 质量 
存储 服务 ， 以 及 数据 管理 能 力 ， 可 满足 后 续 多 波段 分 析 对 大 规模 数据 存储 计算 的 需求 1 。 
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2.3 云 存储 方案 设计 

根据 上 述 具 体 目 标 ， 设 计 云 存储 架构 ， 其 架构 图 如 图 1。 

为 实现 云 存储 架构 ， 进 行 如 图 1 网 络 规划 ， 云 存储 架构 分 为 4 种 类 型 网 络 ， 丝 以 不 同 颜色 表示 。 
(1) 公 共 网 络 。 在 虚拟 路 由 外 侧 ， 供 数据 提供 部 门 (指定 账户 ) 使 用 的 共享 网 络 ， 一 般 接 入 公共 网 络 使 
用 ; (2) 管 理 网 络 。 管 理 服务 器 与 系统 虚拟 机 管理 地 址 之 间 通 讯 的 网 络 ; (3) 客 户 (数据 提供 部 门 ) 网 
络 ， 直 接 分 配给 虚拟 机 使 用 的 虚拟 局 域 网 络 ， 分 为 分 离 和 共享 ; (4) 存储 网 络 。 管 理 网 络 、 数 据 提供 
者 网 络 、 领 域 门户 网 站 与 存储 之 间 的 通讯 ， 或 存储 虚拟 机 与 存储 之 间 的 通讯 。 
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图 1 太阳 物理 历史 观测 资料 存储 服务 云 架 构图 


Fig. 1 Cloud store service chart of solar physics historical observation data 


按照 功能 分 为 6 个 网 段 : 管理 段 、 数 据 提供 者 段 及 太阳 物理 门户 段 ， 每 一 段 分 别 有 内 网 与 外 
网 段 。 

考虑 (1) 有 数据 提供 方位 于 公 网 端 ; (2) 使 用 更 多 网 络 服务 ; (3) 安全 因素 ， 如 VLAN; (4) 内 外 
网 交流 ， 将 采用 高 级 资源 域 网 络 部 署 模式 。 

云 存 储 服务 端 ， 将 云 存 储 的 服务 端 部 署 在 国家 天 文 台 总 部 ， 服 务 端的 维护 与 管理 可 以 由 国家 天 文 
台 怀 柔 太阳 观测 基地 信息 技术 团队 进行 。 

客户 端 : 客户 端 是 指 观测 资料 产 出 部 门 ， 如 国家 天 文 台 怀柔 太阳 光学 、 射 电 、 太 阳 活 动 预报 、 紫 
金山 天 文 台 、 云 南天 文 台 与 南京 大 学 等 相关 的 多 个 部 门 。 其 主要 工作 是 根据 自身 特长 处 理 原始 产 出 资 
料 。 在 项 目 执行 前 期 ， 具 有 较 多 专业 知识 人 员 维 护 资料 网 站 ， 资 料 产 出 量 大 的 部 门 ， 可 设置 专门 存储 
服务 器 。 若 不 具备 有 较 多 专业 知识 人 员 的 部 门 ， 根 据 数据 量 大 小 对 一 般 的 台式 机 增加 硬盘 数量 ， 即 可 
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满足 资料 的 数字 化 及 标准 化 处 理 。 当 云 存储 系统 实施 完毕 ， 则 所 有 工作 在 此 系统 进行 。 

太阳 物理 领域 业务 包括 : 数据 库 、 实 时 /历史 数据 分 析 、 资 料 备份 、 资 料 灾 备 、 网 络 服务 。 数 据 
提供 方 业务 包括 : 数据 处 理 、 数 据 备 份 、 数 据 库 等 。 特 别 需 求 包 括 : 各 种 类 型 的 数据 库 都 在 一 起 ， 对 
数据 库 的 要 求 较 高 ， 已 存在 一 个 MySQL 数据 库 。 对 于 通过 同步 盘 ( 人 参见 第 3 节 ) 上传 的 新 数据 ， 通 过 
自动 处 理 机 制 及 时 增加 到 数据 库 ， 使 用 户 通过 网 络 服务 检索 。 

保留 原 有 物理 设备 3 种 ， 其 一 是 数据 提供 方 网 中 即 原 数 据 提供 方 之 一 的 怀柔 基地 团 组 的 数据 处 理 
服务 器 。 考 虑 现 阶段 此 服务 器 更 多 只 用 于 怀柔 基地 的 数据 处 理 ， 单 机 可 满足 资料 处 理 需 求 ， 未 来 可 继 
续 将 其 用 于 分 布 式 计算 的 集群 ， 其 二 是 怀柔 基地 团 组 的 网 络 服务 器 ; 其 三 为 原 有 存储 阵列 。 

拟 新 建 2 种 设备 ， 分 别 用 于 扩展 的 计算 集群 及 扩展 的 存储 集群 。 未 来 的 数据 扩展 都 基于 这 个 存储 
集群 进行 。 

图 1 中 的 虚拟 路 由 对 于 每 一 个 客户 账号 及 每 一 种 网 络 提供 地 址 转换 、 域 名 转换 、 端 口 转换 、 防 火 
墙 、 虚 拟 局 域 网 络 分 配 (VLAN) 、 虚 拟 专用 网 络 设置 (VPN) 、 负 载 平 衡 等 功能 。 虚 拟 监 管 服务 器 通常 
指 如 XenServer、KVM， 完 成 虚拟 化 功能 。 主 存 提供 分 布 式 计算 簇 的 共享 ， 二 级 存储 提供 单个 网 段 的 
使 用 。 在 云 架构 中 主 存 与 二 级 存储 配合 使 用 以 获得 最 大 的 效益 与 弹性 。 

图 1 中 的 具体 配置 命令 参考 标注 9， 中 间 件 配置 参考 标注 2 © 。 


3 备份 、 灾 备 方法 与 规范 


数据 的 存盘 规范 : 不 同 数据 类 型 在 主 目录 下 分 别 建立 子 目录 ， 目 录 名 应 为 资料 种 类 ， 如 手 描 黑 
子 。 资 料 存放 应 按照 种 类 ， 然 后 年 月 日 的 形式 进行 ， 相 应 的 处 理 软件 在 主 目录 下 以 软件 为 名 建立 目 
录 ， 处 理 软件 命名 应 体现 相应 的 资料 类 型 。 

各 个 数据 生产 部 门 应 将 全 部 资料 至 少 备份 2 份 ， 一 份 在 云端 保存 ， 另 一 份 则 在 本 地 以 存储 介质 形 
式 妥善 保存 。 同 时 指定 专人 负责 定期 进行 新 一 代 存储 介质 更 换 ， 以 免 日 后 无 法 找到 原 有 存储 介质 的 接 
口 。 对 于 灾 备 而 言 ， 将 在 北京 怀柔 观测 基地 建立 灾 备 服务 器 ， 根 据 数据 更 新 频率 决定 定期 传输 时 间 周 
期 ， 定 期 远程 启动 灾 备 服务 器 ， 将 不 断 更 新 的 资料 传输 至 此 服务 器 ， 传 输 完 成 后 关闭 服务 器 。 同 样 需 
指定 专人 负责 定期 进行 新 一 代 存储 介质 更 换 。 

各 个 数据 生产 方 与 云端 数据 的 一 致 性 ， 通 过 登录 同步 盘 实 现 。 数 据 源 提供 方 变动 会 影响 另 一 边 ， 
在 云端 留 下 的 是 最 后 变动 结果 。 即 在 同步 盘 中 的 数据 是 需 提供 备份 的 最 终 数 据 。 客 户 端 和 服务 器 端 在 
后 台 自 动 同步 . 对 于 用 户 (各 个 数据 生产 部 ) 而 言 ， 文 件 和 文件 夹 的 操作 跟 本 地 资源 管理 器 的 操作 完全 
一 致 ， 不 受 网 络 影 响 。 

各 个 数据 提供 方 根据 数据 处 理 特点 可 分 别 采 用 日 、 周 或 月 的 固定 备份 规则 进行 ， 建 立 备份 记录 表 
格 ， 根 据 此 表格 ， 为 了 减少 工作 量 ， 只 对 数据 做 增 量 备份 。 对 备份 数据 将 访问 权限 全 部 设置 为 只 读 ， 
不 能 增删 、 修 改 。 为 了 落实 责任 到 人 ， 备 份 记录 表格 中 需 设置 执行 备份 的 责任 人 一 项 。 


4 结束 语 


本 系统 采用 云 存储 架构 ， 为 数据 提供 、 管 理 、 安 全 及 共享 提供 了 最 佳 方式 。 为 未 来 太阳 物理 观 
测 数据 集成 打下 良好 的 基础 。 此 云 存储 系统 可 以 进一步 应 用 到 我 国 现代 太阳 物理 观测 资料 的 存储 及 集 
成 服务 。 
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Abstract: Astronomical data storage method should take the following factors into consideration: the 
convenience of data storage, best user experience and data security. Besides, convenient maintenance of data 
storage should also be included. All those above-mentioned factors are requirements for data storage and 
sharing proposed by almost every large and medium-sized data project. This paper analyzes the storage 
requirements of project of field type and explores the differences of different storage service architectures. 
Based on that, this thesis proposes a cloud storage architecture and also provides the design scheme of this 
field cloud storage service architecture. This architecture can not only meet the demands of data processing, 
unified storage and unified external service, but also offer the best user experience for data query service. At 
the end of this paper, it also discusses how to establish a disaster recovery system as well as specifications. 
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